Nous allons localement installer R et l’éditeur Rstudio, afin de poursuivre le cours FIN 403 depuis chez vous.
ggplot2.df avec comme nom de colonne a et b pour rappel afin de de réaliser les graphes ci-dessous, à l’aide des fonctions suivantes data.frame() ,seq() et sin(). Utilisez cette commande ?sin() et ?seq afin d’obtenir de l’aide dans la fenêtre en bas à droite de Rstudio.geom_point(aes(x=,y=)) à l’aide du package ggplot2, ou de la fonction de base afin de retrouver les graphes suivants.summary(cars) speed dist
Min. : 4.0 Min. : 2.00
1st Qu.:12.0 1st Qu.: 26.00
Median :15.0 Median : 36.00
Mean :15.4 Mean : 42.98
3rd Qu.:19.0 3rd Qu.: 56.00
Max. :25.0 Max. :120.00
Cette page est un document “R Markdown”. Markdown est un simple langage de syntaxe qui permet la génération de code sous format HTML, PDF, et MS Word documents.
Ce n’est pas un outil d’édition comme word «What you see is what you get» WYSIWYG via une interface graphique. A l’opposé Markdown est un code qui peut être catégorisé comme un outil WYSIWYM «What you see is what you mean».
Il faut en quelque sorte le compiler afin de voir le résultats de votre création à l’instar de Word Microsoft. L’avantage de R markdown réside dans la possibilité d’ajouter facilement du code R à l’intérieur de votre document et l’automatisation de rapport grâce au notion de fonction et d boucel que nous avons a vu à la fin du cours dernier.
Pour plus de détail, n’hésitez pas à visiter le site suivant afin de découvrir ce package R http://rmarkdown.rstudio.com.
Quand vous cliquez sur le bouton Knit bouton un document va être créé et vous pouvez facilement ajouté du code R dedans comme ci-dessous à l’aide du boutton Insert :
plot(cars)Vous pouvez faire la même chose avec un graphe
DT::datatable(cars)Vous pouvez faire la même chose avec un graphe interactif grâce au package DT pour plus d’information https://rstudio.github.io/DT/

impressionant
Nous allons parler durant ce cours de :
* Installation de R
* Rmarkdown
* data mining de données de pollution
Nous allons parler durant ce cours de :
<iframe width="560" height="315" src="https://www.youtube.com/embed/rlR4PJn8b8I" frameborder="0" allowfullscreen></iframe>
Fin du dernier cours
for.TD Pollution
On va découvrir comment traiter des données de séries temporelles de pollution et de météo à Shanghai. Pour ce faire, nous allons explorer le fichier csv pollution_shanghai.csv.
Etape de Data Mining
read.table(), read.csv() et readr::read_csv() ou l’interface graphique pour rappel.for.head, tail,View et Summary ?